标签【reinforcement learning】

花费 5 ms

机器学习笔记—增强学习

本文介绍增强学习和自适应控制。在监督学习中，算法是要输出尽量模仿训练集中的标签 y，标签给每个输入 x 一个清楚的正确答案。与此不同，对于许多序列决策和控制问题，就很难对算法给出这种明确的监督。例 ...

选自《Reinforcement Learning: An Introduction》, version 2, 2016, Chapter2 https://webdocs.cs.ualberta. ...